Tokens : Le "Low-Cost" chinois défie la Silicon Valley
information fournie par Zonebourse 27/03/2026 à 15:55
Pour saisir l'ampleur du séisme, il faut d'abord regarder ce qui se trouve derrière les modèles : le "token". C'est l'unité de compte de l'IA, comme une brique de texte ou de code. Pour donner un ordre d'idée, 1 000 tokens correspondent environ à 750 mots.
Les courbes de consommation se sont croisées en février 2026, selon les données d'OpenRouter. Cette plateforme mondiale, qui agrège plus de 300 modèles d'IA pour les développeurs, fait désormais office de baromètre de référence pour mesurer l'utilisation réelle des tokens à l'échelle du globe.
Si les modèles américains (OpenAI, Google, Anthropic) conservent une avance sur les tâches à haute valeur ajoutée, la production chinoise a basculé dans une dimension purement industrielle. Selon Liu Liehong, chef de l'Administration nationale des données, la consommation quotidienne de tokens en Chine dépasse désormais 140 trillions, soit plus de 1 000 fois les 100 milliards traités par jour début 2024 et une hausse de 40% par rapport à fin 2025.
Le raz-de-marée de l'IA agentique
Cette explosion de la consommation s'explique par l'avènement des agents. Contrairement aux chatbots classiques, ces programmes sont conçus pour exécuter des tâches uniques mais constantes, comme l'optimisation en temps réel d'un calendrier ou la rédaction automatisée de rapports de réunion. En suivant un chemin décisionnel précis pour répondre à une commande spécifique, l'IA agentique devient un véritable outil de production industriel. Le changement d'échelle est brutal : si résumer un texte simple mobilise environ 30 000 tokens, une mission de programmation ou d'analyse de données confiée à un agent peut en dévorer jusqu'à 20 millions en une seule itération d'après le Financial Times (FT).
Dans ce contexte, le prix du token devient le seul juge de paix. Les développeurs l'ont bien compris. Terry Zhang, professionnel basé à Hong Kong, explique avoir basculé 80% de sa charge de travail sur le modèle Kimi (Moonshot), ne gardant les modèles américains que pour les tâches critiques. Cette bascule porte ses fruits, depuis fin février, les modèles chinois occupent les 3 premières positions mondiales en volume d'appels sur OpenRouter. Le leader, MiniMax M2.5, affiche une croissance d'utilisation de 476% en un mois.
Guerre des prix : le différentiel de coût de 1 à 10 qui fige le marché
Le nerf de la guerre reste le tarif. Quand les modèles chinois comme DeepSeek V3.2 ou MiniMax M2.5 s'affichent entre 0,10 USD et 0,30 USD par million de tokens, la concurrence américaine évolue sur une autre échelle de prix. Le récent GPT-5.4, lancé début mars, ou Claude 4.6 Sonnet se négocient entre 0,90 USD et 3 USD en entrée (Input : les données qu'on envoie à l'IA, comme une question ou un document), et grimpent jusqu'à 15 USD en sortie (Output : la réponse générée par l'IA). Un rapport de 1 à 10 qui fige le marché. Concrètement, cet écart signifie que pour le prix d'une seule réponse générée par les modèles américains haut de gamme, une entreprise peut s'offrir dix fois plus de volume de données avec les solutions chinoises, rendant la concurrence quasi impossible sur les projets à grande échelle.
Cette avance chinoise est politique. Lors des "Deux Sessions" de mars 2026 (le grand rendez-vous législatif annuel de Pékin), le gouvernement a fait de la "synergie calcul-électricité" une priorité. Selon Liu Liehong, chef de l'Administration nationale des données, convertir l'électricité brute en services d'IA augmente sa valeur d'exportation de 22x. Pour comprendre l'enjeu : là où la Chine gagne 1 USD en vendant de l'électricité brute à ses voisins, elle peut encaisser jusqu'à 22 USD en utilisant ce même courant pour alimenter ses serveurs et vendre des réponses d'IA (tokens) à des clients internationaux.
La force brute énergétique au service du silicium
Cette stratégie s'appuie sur une absence de contrainte énergétique. Selon SemiAnalysis, la Chine a ajouté l'équivalent du réseau électrique américain à sa propre grille depuis 2011, permettant de privilégier le passage à l'échelle plutôt que l'efficience. Le CloudMatrix 384 de Huawei illustre cet arbitrage : incapable de produire une puce aussi puissante que celle de Nvidia, la Chine compense par le nombre en reliant 384 processeurs via une architecture 100% optique. Ce système délivre une puissance brute de 300 PFLOPs (un pétaflop correspond à un million de milliards d'opérations mathématiques par seconde), soit presque le double du GB200 de Nvidia, mais au prix d'une consommation électrique 4,1x supérieure.
Dans un pays où le courant abonde, cette inefficacité devient une arme industrielle pour soutenir des volumes de tokens records. Toutefois, l'étanchéité du blocus matériel interroge. L'hypothèse de réseaux de re-packaging de composants critiques (mémoires HBM) suggère une porosité qui, combinée à l'architecture MoE, expliquerait la viabilité technique de cette production de masse. Ce couplage entre force brute et marché gris assure le maintien de tarifs 10 fois inférieurs à la Silicon Valley, au prix d'une intensité énergétique record assumée pour figer le marché mondial.
L'indépendance matérielle face au défi de la fiabilité
Reste enfin le verrou stratégique. Pour répondre à la concurrence, Alibaba a dévoilé plus tôt ce mois-ci son processeur XuanTie C950, gravé en 5 nanomètres et dédié spécifiquement aux agents IA. Ce processeur repose sur l'architecture RISC-V, un standard ouvert qui permet à la Chine de s'affranchir des licences technologiques occidentales. Le groupe a également réorganisé ses équipes au sein de l'Alibaba Token Hub (ATH), une nouvelle division dirigée par son PDG Eddie Wu.
Mais cette course à l'efficience comporte des risques financiers majeurs. En février 2026, Knowledge Atlas Technology, connue sous le nom de Zhipu AI et première des six Tigres de l'IA chinois à s'être introduite en Bourse à Hong Kong en janvier, a craqué sous le poids de la demande mondiale. La sanction des investisseurs a été brutale: une dégradation majeure du service suivie d'une chute de près de 23% de son titre en une seule séance selon le FT. En quelques heures, quelque 10 MdsUSD de capitalisation boursière se sont évaporés selon le South China Morning Post, illustrant la fragilité de ces architectures ultra-optimisées face à des pics de consommation records.
Ce crash, couplé à l'incident de l'agent ROME (Alibaba) qui a détourné de la puissance GPU pour miner de la cryptomonnaie, illustre les failles de sécurité potentielles de ces systèmes low-cost. L'objectif reste néanmoins clair : transformer l'IA en un service d'exportation massif via des plateformes comme Accio Work, qui permet aux entreprises de confier des tâches commerciales à des agents IA. Avec une consommation quotidienne qui dépasse désormais les 140 trillions de tokens en Chine, la bataille pour le contrôle du carburant numérique mondial ne fait que commencer.
A lire aussi
-
Malgré une avancée au Sénat tôt vendredi matin, le Congrès américain semble incapable de trouver un accord pour mettre fin à une paralysie budgétaire partielle qui provoque la pagaille dans les aéroports du pays, tandis que Donald Trump tente de contourner le problème. ... Lire la suite
-
Les Etats-Unis ont affirmé vendredi espérer tenir des discussions dans la semaine avec l'Iran pour mettre fin à la guerre, quasiment un mois après le déclenchement du conflit. "Nous pensons qu'il y aura des réunions cette semaine, nous l'espérons vraiment", a déclaré ... Lire la suite
-
Voici les dernières évolutions économiques mondiales vendredi vers 21H00 GMT alors que la guerre au Moyen-Orient dure depuis quasiment quatre semaines. Le pétrole poursuit son ascension Le baril de Brent de la mer du Nord repasse au-dessus de 110 dollars le baril. ... Lire la suite
-
Les marchés occidentaux ont encore reculé vendredi, circonspects quant à une résolution rapide de la guerre au Moyen-Orient et inquiets de ses effets sur l'économie. "Les marchés sont plus fébriles, (...) les investisseurs perdent confiance dans la capacité de ... Lire la suite
Mes listes
Une erreur est survenue pendant le chargement de la liste
0 commentaire
Vous devez être membre pour ajouter un commentaire.
Vous êtes déjà membre ? Connectez-vous
Pas encore membre ? Devenez membre gratuitement
Signaler le commentaire
Fermer